Serveur d'exploration sur la TEI

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

TEI (Text Encoding Initiative)

Identifieur interne : 000365 ( Main/Exploration ); précédent : 000364; suivant : 000366

TEI (Text Encoding Initiative)

Auteurs : Francois Role [France]

Source :

RBID : Pascal:05-0464054

Descripteurs français

English descriptors

Abstract

Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le IIIe siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.


Affiliations:


Links toward previous steps (curation, corpus...)


Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" level="a">TEI (Text Encoding Initiative)</title>
<author>
<name sortKey="Role, Francois" sort="Role, Francois" uniqKey="Role F" first="Francois" last="Role">Francois Role</name>
<affiliation wicri:level="4">
<inist:fA14 i1="01">
<s1>Université Paris 8</s1>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<settlement type="city">Paris</settlement>
<region type="region" nuts="2">Île-de-France</region>
</placeName>
<orgName type="university">Université Paris 8</orgName>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">05-0464054</idno>
<date when="1999">1999</date>
<idno type="stanalyst">PASCAL 05-0464054 INIST</idno>
<idno type="RBID">Pascal:05-0464054</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000035</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000017</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000047</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000047</idno>
<idno type="wicri:Area/Main/Merge">000392</idno>
<idno type="wicri:Area/Main/Curation">000365</idno>
<idno type="wicri:Area/Main/Exploration">000365</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr" level="a">TEI (Text Encoding Initiative)</title>
<author>
<name sortKey="Role, Francois" sort="Role, Francois" uniqKey="Role F" first="Francois" last="Role">Francois Role</name>
<affiliation wicri:level="4">
<inist:fA14 i1="01">
<s1>Université Paris 8</s1>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<settlement type="city">Paris</settlement>
<region type="region" nuts="2">Île-de-France</region>
</placeName>
<orgName type="university">Université Paris 8</orgName>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">Techniques de l'ingénieur. Documents numériques Gestion de contenu</title>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">Techniques de l'ingénieur. Documents numériques Gestion de contenu</title>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Coding</term>
<term>Document structure</term>
<term>Document type definition</term>
<term>Electronic document</term>
<term>Markup</term>
<term>SGML language</term>
<term>Text</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Document électronique</term>
<term>Texte</term>
<term>Codage</term>
<term>Balisage (document)</term>
<term>Structure document</term>
<term>Définition type document</term>
<term>Langage SGML</term>
<term>TEI (Text Encoding Initiative)</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr">
<term>Document électronique</term>
<term>Codage</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le III
<sup>e</sup>
siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>France</li>
</country>
<region>
<li>Île-de-France</li>
</region>
<settlement>
<li>Paris</li>
</settlement>
<orgName>
<li>Université Paris 8</li>
</orgName>
</list>
<tree>
<country name="France">
<region name="Île-de-France">
<name sortKey="Role, Francois" sort="Role, Francois" uniqKey="Role F" first="Francois" last="Role">Francois Role</name>
</region>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Ticri/explor/TeiVM2/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000365 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 000365 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Ticri
   |area=    TeiVM2
   |flux=    Main
   |étape=   Exploration
   |type=    RBID
   |clé=     Pascal:05-0464054
   |texte=   TEI (Text Encoding Initiative)
}}

Wicri

This area was generated with Dilib version V0.6.31.
Data generation: Mon Oct 30 21:59:18 2017. Site generation: Sun Feb 11 23:16:06 2024